打开网易新闻 查看精彩图片
整理 | 唐小引、王启隆
出品丨AI 科技大本营(ID:rgznai100)
今天是一年一度的女性节日,祝所有在技术世界里驰骋的女性朋友们节日快乐。
打开网易新闻 查看精彩图片在 AI 界,我们总会想起一位杰出的女性科学家,她就是美国三院院士、斯坦福终身教授李飞飞。关于李飞飞的故事我们听过许多,人们既惊叹于她在人工智能领域的诸多贡献,又很为她的励志故事所感慨万分。去年 11 月,李飞飞的自传 The Worlds I See(《我看见的世界》)英文版发布,其间以她细腻的文笔书写了自己的成长故事,尤其披露了许多可能不为人知的细节,同时讲述了人工智能领域计算机视觉革命的来龙去脉。值得一提的是,中文版在今年也将与我们见面,由中信出版集团出版。
打开网易新闻 查看精彩图片CSDN 创始人&董事长蒋涛在读完此书后,发出了如此感慨:“感人至深而意味深长的科学家传记。人工智能新时代的到来,是因为李飞飞团队在ImageNet大规模数据集的工作取得范式突破,让神经网络算法焕发出人类大脑的智慧,这一切如何发生的?作者用亲身视角展示了突破创造的科学研究,是如何一步步传承发展,每一阶段作者和前沿的科学家们又是如何思考的,如何恰逢其时各种因缘际会而大成。对于有志于科学研究的青年还有想了解人工智能如何发展的读者,这本书都是不可多得的佳作。”
在今天这一特别的日子里,我们一起走进由李飞飞亲自讲述的关于她及人工智能的故事。
打开网易新闻 查看精彩图片年少时光的爱与打击
李飞飞出生于北京,但在相隔千里的四川省会成都长大。这里是她母亲的老家,母亲在李飞飞的生命里有着极其重要的影响。 在自传开篇,李飞飞分享了自己在 2018 年与 OpenAI 联合创始人 Greg Brockman 等一起参加美国国会听证会背后的纠结:“我是家里的独女,是父母唯一的经济支柱,同时还要担任他们与看护人员之间的翻译。想到这些,我不禁觉得真不该安排这次行程。但是,能出席这次听证会让身为移民的母亲感到无比骄傲,相比之下,疾病根本不算什么。在来美国仅仅 20 年后,她竟然可以看到自己的女儿在美国国会发表演讲,这样的机会绝对不能错过。在我的整个职业生涯中,母亲自始至终坚定地支持我,所以我相信她会坚决要求我参加听证会……母亲要求我来参加听证会是对的。我确信人工智能未来所依赖的机构范畴远远超出科学界,还包括教育机构、行动组织,当然还有政府。”
在李飞飞的生命里,父母、外祖父母对她有着极为深刻的影响:“外祖父母对我的培养方式也契合了父母的价值观。他们对我疼爱有加,但我从来不会觉得因为他们宠我,就不会管束我。他们并不认同他们这代人中盛行的重男轻女的观念,而是跟父母一样,鼓励我展开想象,并坚守原则:我首先是个独立的个体,其次才是个女孩。”
然而年少的李飞飞还是遭遇了一次性别上的打击,在一个平淡无奇的一天,老师在下课时提出了一个奇怪的要求:女生先回家,男生在座位上多坐几分钟。这让李飞飞好奇了起来,于是在教室门口徘徊,藏在了一个能听到老师说话的地方。而所听到的话却让她备受打击、终生难忘。
老师说:“我让女同学先走,是因为现在我要告诉你们:你们的整体表现是不行的。男孩天生就比女孩聪明,数学和科学就是体现你们脑子灵光的基础学科。你们的平均成绩竟然比女生还低,这种情况没有任何借口。我今天对你们非常失望。”
接下来,也许是觉得有必要鼓励一下大家,老师的语气似乎缓和了一些:“但你们也不要自暴自弃。等到了十几岁,你们会发现,周围的女生自然就变笨了。她们后劲不足,成绩会不断下降。即便如此,我还是希望你们都能更加努力,发挥你们作为男生的潜力。落在女生后面是不可接受的,大家明白了吗?”
因为小学老师的“女生长大就变笨”的言论,对她形成了刺激,在后来学习物理受挫时,就想到此 —— 「女生就是不如男生吗?难道这就是等待每个女孩智力发展的残酷命运吗?最糟糕的是(甚至比我的课堂表现还要糟糕),我找不到答案。」
在小学的最后一个暑假,李飞飞被父母告知,他们需要先后移民至美国。此刻的她还不知道这意味着什么。短短几周后,家中就只剩下李飞飞和母亲两人。和父亲的这一别,便是三年。
在此期间,李飞飞对父亲的思念从未改变,记忆中的父亲曾在一家化学公司的计算部门工作,他对严肃性有一种病态的过敏,天生就能从光、速度、扭矩、力、重量和张力的角度来看待世界,在家里通过物理学知识解决各种难题。这份思念促使着她去了解父亲热爱的物理学,她也开始逐渐了解物理学的美丽和伟大。随着物理成绩的进步,一项新技能似乎正源源不断地从她身上涌出——她意识到,这就是自己第一次爱上的事物,持续时间可能是一生。
15 岁那年,李飞飞怀揣着复杂的心情,跟着母亲来到上海的浦东机场。在外滩,她想到了爱因斯坦也曾是个移民,这带给了她一丝乐观的情绪。
目的地,美国。她的身边除了母亲,唯有物理学。
打开网易新闻 查看精彩图片寻找北极星
李飞飞和父亲时隔三年的重逢既没有感人泪下的情节,也没有发生突如其来的转折。他的父亲因二手车抛锚姗姗来迟,母女两人在机场出口徘徊了数小时。这段经历还让李飞飞发现,自己学了几年的基础英语,在实际生活中似乎毫无用处。
对那个年代的移民家庭来说,这一切只是家常便饭。
在名为帕西帕尼的小镇,她们开始了新生活:李飞飞不仅需要从头学习自己无比熟悉的数理术语的英文说法,甚至还要学起日常交际英语。这种语言不通的问题困扰着整个家庭,因此她们一家三人都需要从底层打工开始做起:不稳定的兼职、贫乏和劳动的循环、高速发展的机器学习技术(此时的 CNN 之父杨立昆,才刚起步自己的研究人生)……一切都比她离开的世界“更明亮、更快、更沉重、更喧闹”。
除了有些累的新生活,母亲恶化的病情也令李飞飞十分担忧。在某一日的家庭出游中,父亲将车开到了普林斯顿大学的校园,一尊青铜半身像引起了她的注意——那正是爱因斯坦的纪念雕像。
看着这尊雕像,她意识到,自己对物理学的热情只是被新环境吓到了,并没有消退。很快,她重新找到了自己追逐的目标。
打开网易新闻 查看精彩图片学年第一次的数学考试,李飞飞离拿 A 只有 0.6 分之遥。这场失利除了让她十分沮丧,还让她鼓起勇气,开始频繁拜访数学老师的办公室请教问题。
她的高中数学老师鲍勃·萨贝拉(Bob Sabella)拥有独立的办公室和首席教师的头衔。萨贝拉为李飞飞的新生活带来了很大的帮助,由于帕西帕尼高中没有微积分课,所以萨贝拉为李飞飞专门设计了一个临时的课程,在午休期间教导她。萨贝拉不仅会在交流中指出她的用词错误并不厌其烦地解释单词和英语概念,还和她交流在文学上的兴趣:萨贝拉向李飞飞推荐科幻书籍,而她又给萨贝拉推荐中国的“四大名著”。
两人逐渐熟络,李飞飞的父母亲切地称呼萨贝拉为“大胡子数学老师”,而萨贝拉和他的妻子琼也将李飞飞视如己出,带她去迪斯尼度假。
高三毕业后,李飞飞怀揣着对爱因斯坦的憧憬,考进了普林斯顿大学。准确地说,李飞飞不仅进入了普林斯顿大学的提前录取周期,还获得了全额的经济援助奖学金。这一结果同样惊呆了栽培她的萨贝拉老师。
步入大学后,李飞飞开始逐渐游走于“现实”和“校园”两个世界。在“现实”中,她需要照顾母亲加重的病情和家庭的经济情况;而在“校园”里,她接触到了无数的少年天才们,以至于她在书中将普林斯顿大学形容为“智力天堂”。她依旧紧密保持着和萨贝拉夫妇的联系,他们是她在美国为数不多的朋友,且在李飞飞认识的成年人当中,只有这对夫妇真正经历过大学生活,可以给予她“过来人的经验”。
好景不长,大一还未结束,两个世界如同脱轨的列车互相碰撞。原来,李飞飞的母亲在十几岁时就患有风湿热,病情不断地加重,并开始威胁生命。此时,依然是萨贝拉夫妇站了出来,为李飞飞的母亲找到了面向低收入家庭的手术机构。针对李飞飞家庭加剧的经济危机,萨贝拉夫妇借给她 2 万美元开了一家干洗店,让她的父母经营。李飞飞在过往和这对夫妇无话不谈,甚至常和萨贝拉老师就一些无关紧要的问题唇枪舌剑一番。但收到这笔钱,却令她无话可说。
从此,她几乎每个周末都要回家帮忙经营父母的干洗店。令人振奋的是,李飞飞的父母也在正式经营干洗店之后,也因生活步上正轨逐渐找回了自信。
大二那年的夏天,李飞飞被伯克利大学的神经科学实验选中作为助理,得以前往加州,第一次见识真正的前沿科学世界。实验的内容是:如果给一只猫播放一连串视觉刺激图像,我们是否能够利用猫大脑中检测到信号来重建这些片段?
在黑暗的实验室中,是那令人终生难忘的景象:扩音器混乱的噪声,节奏的声音变化,每个看似统一的神经元群显示出独特的音调,以及通过这些信号所重建的、猫脑海中的景象。这份经历成为了李飞飞人生的转折点,她意识到物理学的魅力不仅是方程式,还有对其象征意义的追逐和探索。她在书中忘我地回忆这场实验的每一起细节,仿佛灵魂的一部分永远留在了伯克利的实验室,从未离去。
李飞飞的父母移民美国闯荡,她将父母对无限机会的追求比喻为“北极星”。“北极星”是历史上每一位科学家穷尽一切追逐的坐标,而找到属于自己“北极星”的人,会在余生焕发出无与伦比的活力。物理学教给了李飞飞一件事,那就是对提出重大问题和寻求“北极星”的热情。
打开网易新闻 查看精彩图片初次亮相
在李飞飞毕业的那年,互联网泡沫爆发了。
正值互联网行业蓬勃发展之际,就连华尔街也疯狂找人,想赶上这一风口。李飞飞一下收到了多家顶级投行抛出的橄榄枝,但母亲只用了两个问题,让她重新审视自己的内心追求。
“妈妈,我面试了几家公司,就是一些华尔街巨头,他们给的条件很诱人……”
“华尔街巨头?”
“就是股票、交易什么的。搞投资的。会有很多东西需要学习,但如果我下决心,肯定能学会的……”
“这是你想要的吗?”
“我的意思是,光是薪水就足以改变我们的生活了,而且——”
“飞飞,这是你想要的吗?”
“…你知道我想要什么,妈妈。我想成为一名科学家。”
“那还有什么好说的呢?”
2001 年,李飞飞赴加州理工学院深造,在计算机视觉领域的两位杰出导师彼得罗·佩罗纳(Pietro Perona)教授和克里斯托夫·科赫(Christof Koch)教授的指导下,专注于神经科学与计算机科学交叉学科的研究。彼得罗和克里斯托夫都是具有冒险精神的学者,痴迷于最前沿的计算机视觉研究。这种情绪带动着李飞飞,他们鼓励她广泛阅读文献,紧跟领域的最新发展。
在彼得罗的办公室外,她还邂逅了自己未来的伴侣:西尔维奥·萨瓦雷斯(Silvio Savarese)。她对西尔维奥的最初印象是“充满好奇心的呆子”——就像她自己一样。
博士学业完成后,李飞飞前往伊利诺伊大学香槟分校和普林斯顿大学担任助理教授,正式开始自己的学术生涯。
当时,人工智能尚未受到广泛关注,而她选择的计算机图像识别更是鲜有人涉足的冷门方向。即使面临资金申请困难、外界质疑以及性别与种族偏见等多重挑战,李飞飞仍怀揣着热情坚持投入研究,自掏腰包补贴项目。
研究之初,李飞飞面临的不仅仅是技术上的挑战,还深受性别偏见的影响。有些教授甚至嘲讽她,不如做点有用的事。尤其是在研究界,有一种长期的偏见:他们认为,李飞飞作为亚裔女性,啃计算机图像识别这块硬骨头,根本不可能做出成绩。
在经历了艰难的研究初期和几乎停滞不前的进展后,李飞飞结识了自己在普林斯顿大学的校友 & 同事、计算语言学教授克里斯蒂安·菲尔鲍姆(Christiane Fellbaum)。这次谈话中,克里斯蒂安向李飞飞提出了一个将改变后者命运的问题:
“你听说过一个叫 WordNet 的项目吗?”
WordNet 是一个由普林斯顿大学认识科学实验室建立和维护的词典项目。这个项目的目标可谓是野心勃勃:将人类通过语言表达的每一个概念都组织到一个庞大的单词数据库。这个项目还有一个衍生的项目 ImageNet,即用视觉示例阐释 WordNet 包含的每一个概念。克里斯蒂安正是 WordNet 项目的联合开发者。
李飞飞心动了。WordNet 的项目概念让她发现,正如婴幼儿通过观察无数物体和场景来学习识别一样,计算机或许也能通过分析大量图片及其关联性进行学习。于是,她向克里斯蒂安讨来了“ImageNet”这个“失败作”的名字,打算让这个名字承载自己的想法。
在构建包含数百万张图片的数据集过程中,李飞飞遭遇了巨大工程难题。幸运的是,她得到了李凯教授及学生邓嘉的支持,借助他们的分布式计算专长解决了数据下载和标注的问题。从手动搜索下载到编写爬虫自动抓取 Google 上的图片,再到利用 Amazon Mechanical Turk 众包平台进行全球范围内的标注工作,历经两年艰辛努力,终于建立起拥有近 1500 万张图片的 ImageNet 数据库。
期间,李飞飞的“师爷”、彼得罗教授的导师吉滕德拉(Jeetendra)教授找到她询问近况。她有问必答,结果却被吉滕德拉泼了一身冷水:“你们在这个想法投入太多了……科学的诀窍是跟随着你的领域一起成长。不要太超前。”在此之前,李飞飞还想过找吉滕德拉做自己的推荐人。
2009 年,他们将论文 ImageNet: A Large-Scale Hierarchical Image Database 投向了计算机视觉的顶会之一:CVPR(Conference on Computer Vision and Pattern Recognition)。令人大跌眼镜的是,CVPR 的主办方直接拒绝让她上台演讲,只允许展出一张小海报。
北极星开始闪烁,逐渐暗淡,几近失去光芒。
打开网易新闻 查看精彩图片照亮人类道路的星
ImageNet 发布的第二年,为了检验其潜力,李飞飞的团队决定将 ImageNet 引入第二年在欧洲举行的计算机视觉大赛中,提议参赛者使用该数据库来训练他们的算法,从而催生了 ImageNet 大规模视觉识别挑战赛(ILSVRC)。
李飞飞的人生与事业也迎来了新的阶段,她在同年受聘于斯坦福大学担任助理教授职位。彼时,她已婚嫁给了西尔维奥,但因其工作关系身处密歇根大学,两人面临地理上的长期分离问题。
现实不是小说。最初的 ILSVRC 比赛在李飞飞被视为 ImageNet 历史上“最令人泄气”的时刻之一,没有多少创新的发明在比赛中诞生。
就这样,转眼来到 2012 年的第三届 ILSVRC,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 三位学者运用基于神经网络的 AlexNet 模型,在 ImageNet 上取得了显著成果,错误率降至 15.3%,远远领先于其他参赛者。这次突破打破了人们对神经网络的传统认知,也让 ImageNet 名声大噪。
当时的李飞飞正处于产假,并突然接到了萨贝拉教授逝世的噩耗,故而未能亲临意大利佛罗伦萨的颁奖现场。但她敏锐地感知到这将是人工智能发展史上的一个重大时刻,于是在一个晚上果断购机票连夜飞往意大利观礼。
2012 年,33 岁的李飞飞被斯坦福大学授予终身教职荣誉,成为该系有史以来最为年轻的终身教授。
Hinton 基于 ImageNet 所研发的深度神经网络确实颠覆了整个领域,它标志着计算机视觉技术的重大飞跃。截至 2017 年的比赛,计算机识别图像中物体的错误率已从 2012 年的 15% 骤降至不足 3%——此刻,计算机的视觉能力已经超越了人类水平。
随着 ImageNet 的成功,李飞飞的名字与人工智能领域的革新紧密相连,她的工作为后来的研究者提供了坚实的基础,激励着无数科技人才投身于人工智能尤其是计算机视觉的研究。而她本人在面对性别歧视、种族偏见以及学术困境时展现出的坚韧不拔和智慧勇气,也成为了女性科学家在科研道路上克服困难、追求卓越的典范。
如今计算机视觉领域有 Sora 横空出世,大模型依然混战不断,AGI 的未来充满着不确定性。这里以李飞飞自传的最后一段结尾,祝每一位迷茫的开发者、每一位努力奋斗的女性都能找到属于自己的“北极星”:
“在现实世界中,存在着一颗北极星,那是小熊星座中最明亮的恒星。而在思想的世界里,却存在无数个类似的导航指引。每一种新的追求,每一个新的痴迷,都悬挂在黑暗的地平线上,闪烁着耀眼的光芒,向不懈追寻的人们招手致意。这就是为什么我最大的快乐在于知道旅程永远不会结束,我也永远不会停歇。总会有新的事物等着我去追逐探索。对科学家而言,想象力就如同布满北极星的璀璨天空。”
打开网易新闻 查看精彩图片
4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫描下方海报中的二维码,进一步了解详情。
打开网易新闻 查看精彩图片